AI资讯新闻榜单内容搜索-Deepseek R

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Deepseek R
豆包你来真的!豆包超能创意1.0超超大杯测评来了

豆包你来真的!豆包超能创意1.0超超大杯测评来了

豆包你来真的!豆包超能创意1.0超超大杯测评来了

原本的我:我把话撂这儿了,就是DeepSeek R2来了,我都不更!有事假期结束再说。 看完豆包Case的我:哎嘿真香~不是我卷朋友们,实在是它这波真的很强,非常强,4o在我这里暂时都没那么香了。废话咱就不多说了,还是先简介然后上案例!

来自主题: AI资讯
7890 点击    2025-05-01 14:40
应激的Llama,开源的困局

应激的Llama,开源的困局

应激的Llama,开源的困局

在DeepSeek R1-V3、GPT-4o、Claude-3.7的强势围攻下,Meta坐不住了。曾作为开源之光的Llama在一年的竞争内连连失利,并没有研发出让公众惊艳的功能。创始人扎克伯格下达死命令,今年4月一定要更新。

来自主题: AI资讯
6704 点击    2025-04-25 08:56
2025中国AI出海洞察

2025中国AI出海洞察

2025中国AI出海洞察

2025开年伊始,从1月DeepSeek R1发布引发新一轮国产大模型技术爆发,到3月Manus横空出世启动内测打开AI智能体话题热度,从底层基础设施到终端产品应用,从产业深耕提升纵深能力到产品创新形成差异化竞争优势,无论是技术能力还是商业模式,国产AI都处于全球领先水平。海外无论是政策环境还是供需关系,均从内外部双轮驱动国产AI出海蓄势待发。

来自主题: AI资讯
4699 点击    2025-04-23 09:34
全国产算力!一手实测科大讯飞推理模型星火X1,与R1不相上下?

全国产算力!一手实测科大讯飞推理模型星火X1,与R1不相上下?

全国产算力!一手实测科大讯飞推理模型星火X1,与R1不相上下?

就在昨天,深耕语音、认知智能几十年的科大讯飞,发布了全新升级的讯飞星火推理模型 X1。不仅效果上比肩 DeepSeek-R1,而且我注意到一条官方发布的信息——基于全国产算力训练,在模型参数量比业界同类模型小一个数量级的情况下,整体效果能对标 OpenAI o1 和 DeepSeek R1。

来自主题: AI资讯
7765 点击    2025-04-22 08:29
过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

随着 OpenAI o1 和 DeepSeek R1 的爆火,大语言模型(LLM)的推理能力增强和测试时扩展(TTS)受到广泛关注。然而,在复杂推理问题中,如何精准评估模型每一步回答的质量,仍然是一个亟待解决的难题。传统的过程奖励模型(PRM)虽能验证推理步骤,但受限于标量评分机制,难以捕捉深层逻辑错误,且其判别式建模方式限制了测试时的拓展能力。

来自主题: AI技术研报
6952 点击    2025-04-14 14:39
AI奥数大奖出炉,英伟达摘桂冠!14B破解34题暴击DeepSeek R1

AI奥数大奖出炉,英伟达摘桂冠!14B破解34题暴击DeepSeek R1

AI奥数大奖出炉,英伟达摘桂冠!14B破解34题暴击DeepSeek R1

AIMO2最终结果出炉了!英伟达团队NemoSkills拔得头筹,凭借14B小模型破解了34道奥数题,完胜DeepSeek R1。

来自主题: AI资讯
5892 点击    2025-04-14 11:42
英伟达253B开源新王登场,Llama 4三天变陪衬!直逼DeepSeek-R1成推理天花板

英伟达253B开源新王登场,Llama 4三天变陪衬!直逼DeepSeek-R1成推理天花板

英伟达253B开源新王登场,Llama 4三天变陪衬!直逼DeepSeek-R1成推理天花板

Llama 4刚出世就被碾压!英伟达强势开源Llama Nemotron-253B推理模型,在数学编码、科学问答中准确率登顶,甚至以一半参数媲美DeepSeek R1,吞吐量暴涨4倍。关键秘诀,就在于团队采用的测试时Scaling。

来自主题: AI资讯
5576 点击    2025-04-09 18:02
用思维干预直接干预LRM内部推理,三种方式实现DeepSeek-R1有效控制。 | 最新

用思维干预直接干预LRM内部推理,三种方式实现DeepSeek-R1有效控制。 | 最新

用思维干预直接干预LRM内部推理,三种方式实现DeepSeek-R1有效控制。 | 最新

推理增强型大语言模型LRM(如OpenAI的o1、DeepSeek R1和Google的Flash Thinking)通过在生成最终答案前显式生成中间推理步骤,在复杂问题解决方面展现了卓越性能。然而,对这类模型的控制仍主要依赖于传统的输入级操作,如提示工程(Prompt Engineering)等方法,而你可能已经发现这些方法存在局限性。

来自主题: AI技术研报
1742 点击    2025-04-08 08:50
DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法。DeepSeek R2,果然近了。

来自主题: AI技术研报
7790 点击    2025-04-05 01:14